CPI各分项权重估算
文: 申万宏源宏观 李慧勇、王健、余子珍
感谢实习生黄云昊对本文作出的贡献!
结论或者投资建议:
我们研究了CPI分项权重的三种估计方法,并进行了适当的检验,拟合度比较好。
12选7解方程筛选法,适用2016年CPI八大类权重估计。采用2016年CPI八大类环比数据,从12个月中选取7个月,结合权重相加和为1的限制方程,解八元一次方程,得796组解;通过设置检验条件,得到14组合适的八大类权重估计值。此方法结果较好,但数据量要求较为苛刻。
最优化法,适用2016年CPI大类权重估计。用2016年CPI八大类环比数据在限制条件内,以最小均方误差为优化目标,采用拉格朗日法,得到最优化权重结果。这类方法适用范围广,但对波动较小的类别估计较差。
贡献率逆推法。结合统计局每月公布的食品分项同环比数据以及影响CPI数值,依据公式“权重*分项变化数=拉动CPI变化数”,并四舍五入影响,逆推出权重范围。此类方法结果精确,但随着样本数增加,权重范围交集较难取得,影响最终结果。
利用最优化法计算得到的权重具有极好的拟合效果。我们利用最优化法测算得到的CPI分项权重分别为:食品烟酒31.1%,衣着9%,居住19.4%,生活用品及服务5.5%,交通和通信14%,教育文化和娱乐9.4%,医疗保健7.5%,其他用品和服务4.2%。根据测算的权重对CPI进行拟合,拟合值与真实值之间的差约在0.01左右。
正文
国家统计局没有公布CPI各分项的具体权重,加大了CPI预测的难度。因客户问的比较多,我们研究了一些方法对CPI分项权重进行估计,并进行了适当的检验,拟合度比较好。
1. 解方程筛选法
12选7解方程筛选法,适用计算八大类CPI权重。采用2016年CPI八大类环比数据,从12个月中选取7个月,每个月列出权重相加方程,再加上相加和为1的限制方程,共8个方程8个未知数得到确定解,共796组解。然后设置筛选条件,用其余数据进行比对筛选,结合统计局公布信息,得到一组最合适的八大类权重估计值。
据统计局公布,CPI权重每5年大变动一次,每年小变动一次。最近一次大变动是2016年,所以我们可以用2016年全年CPI数据去估计CPI权重。
如果2016年各月权重固定,CPI应该等于各分项同比数值乘以权重。12个月CPI数据得到12个方程,限制条件为八个分项权重相加为1,每个分项权重大于0小于1,共13个方程8个未知数,理论上无精确解。从而我们选取7个月作为联立方程组,加上权重相加为1的方程组成8个方程8个未知数的方程组,可得到唯一精确解。
在matlab编程的帮助下,我们采用以下方法进行操作:
a. 设立未知数:设立八个权重未知数Wi(i取1至8),分别表示食品烟酒、衣着、居住、生活用品及服务、交通和通信、教育文化和娱乐、医疗保健、其他用品和服务的权重;
b. 建立方程组并求解:选取7个月CPI数据得到七个方程,即:
联立∑w_i =1(i=1,2,...8),表明八个CPI分项权重相加为1;建立八元一次方程组。
2016年有12个月CPI数据,每次选出7组,共有C_12^7种不重复的选法,得到792组有效解;
c. 第一次筛选:对上述792组解,采用条件“分项权重大于0小于1”,进行筛选,即满足:
剔除567组数据,剩余225组有效解;
d. 第二次筛选:利用剩下来5个月CPI环比数据对求解进行核算,与实际公布的CPI数值比较,剔除误差大于0.05的解,共剔除111组数据,得到114组有效解;
e. 第三次筛选:利用16年12个月CPI同比和累计同比数据进行核算,要求12个月都满足绝对误差小于0.05,共剔除100组数据,剩余14组数据,列举如下:
2. 最优化法
最优化法,适用于计算大类CPI权重。采用2016年CPI八大类环比数据在限制条件内,以最小均方误差为优化目标,采用拉格朗日法,得到最优化权重结果。具体地:
建立数学方程形式:
其中〖CPI〗_i代表2016年第i个月的CPI当月环比数据,〖CPI〗_i^sp代表第i个月CPI的分项环比行向量,W代表权重列向量。限制条件是每个权重大于0且小于1,分项权重相加为1。
列出上述线性最优化问题后,我们可采用拉格朗日法对其求最优解。得到CPI八大分项权重,且与第一种方法计算出的CPI分项权重差异较小。
数据验证:基于16年以来CPI当月同比和累计同比数据,对上述权重进行检验,我们发现除了16年1月份数据拟合效果略有差异,其他结果均非常精确。
类似的,我们给出CPI食品和非食品权重,以及消费品和服务权重:
3. 根据贡献度逆推法
根据统计局公布的贡献率逆推法,适用2017年CPI重点食品分项权重。国家统计局2017年1月与2月不仅公布当月同比和环比数据,对变化较大的重点食品分项同时还公布了对CPI拉动百分点数,这为计算食品分项权重提供一种渠道。具体公式如下:
权重*分项变化数=拉动CPI变化数
考虑四舍五入因素,我们对分项CPI变化数和拉动CPI变化数均考虑0.05的误差范围0.05,以2017年1、2月数据估计取交集得到最终权重范围。
以猪肉为例,按照国家统计局,2017年2月同比下降0.9%,影响CPI下降0.03个百分点, 2月环比下降1.6%,影响CPI下降0.05个百分点。按照同比数据,我们将猪肉价格取值为(0.85%,0.95%),拉动CPI取值为(0.045%,0.055%),算出交集权重为(2.73%,3.55%),同理算出1月份权重区间,再取交集得到最终猪肉的权重范围为(2.73%,2.77%)
因数据过于精确导致极小的误差均能带来结果的改变,蔬菜、蛋类两项的权重无法取到交集范围,其他均能有效估出,具体范围如下: